模糊C均值聚类算法(FCM)

一、算法描述

模糊聚类算法是一种基于函数最优方法的聚类算法,使用微积分计算技术求最优代价函数.在基于概率算法的聚类方法中将使用概率密度函数,为此要假定合适的模型.模糊聚类算法中向量可以同时属于多个聚类,从而摆脱上述问题.在模糊聚类算法中,定义了向量与聚类之间的近邻函数,并且聚类中向量的隶属度由隶属函数集合提供.对模糊方法而言,在不同聚类中的向量隶属函数值是相互关联的.硬聚类可以看成是模糊聚类方法的一个特例。

设被分类的对象的集合为:X={ 1, 2,⋯, XN},其中每一个对象  有rt个特性指标,设为= ( 1 , 2,⋯,Xnk)T,如果要把X分成c类,则它的每一个分类结果都对应一个 c×N阶的Boolean矩阵U=[M ]Ⅳ,对应的模糊c划分空间为: 

∑M =1,v k;0<∑M ,v i}在此空间上,
模糊c均值算法如下: 

Repeat for 1=1,2⋯⋯ 

Step 1:compute the cluster prototypes(means)
Step 2:compute the distance: 
Step 3:Update the partition matrix: 


二、算法代码

function [center, U, obj_fcn] = FCMClust(data, cluster_n,options) 
% FCMClust.m   采用模糊C均值对数据集data聚为cluster_n类  
% 用法: 
1.   [center,U,obj_fcn] =FCMClust(Data,N_cluster,options); 
%  2.   [center,U,obj_fcn] = FCMClust(Data,N_cluster); 
%输入: 
%   data  ---- nxm矩阵,表示n个样本,每个样本具有m的维特征值
%   N_cluster   ----标量,表示聚合中心数目,即类别数 
%   options     ---- 4x1矩阵,其中 
%       options(1):  隶属度矩阵U的指数 (缺省值: 2.0) 
      options(2):   最大迭代次数 
%       options(3):   隶属度最小变化量,迭代终止条件(缺省值: 1e-5) 
%       options(4):  每次迭代是否输出信息标志  (缺省值: 1) 
%输出: 
%      center      ---- 聚类中心 
    U              ---- 隶属度矩阵
%      obj_fcn     ---- 目标函数值 
%   Example: 
%       data = rand(100,2); 
%       [center,U,obj_fcn] = FCMClust(data,2); 
%       plot(data(:,1),data(:,2),'o'); 
%       hold on; 
%       maxU = max(U); 
%       index1 = find(U(1,:) ==maxU); 
%       index2 = find(U(2,:) == maxU); 
%        line(data(index1,1),data(index1,2),'marker','*','color','g'); 
      line(data(index2,1),data(index2,2),'marker','*','color','r'); 
      plot([center([1 2],1)],[center([1 2],2)],'*','color','k') 
    hold off; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%   

if nargin~= 2 & nargin ~= 3,     %判断输入参数个数只能是2个或3个      
    error('Too many or too few input arguments!');
end      
data_n= size(data, 1); % 求出data的第一维(rows)数,即样本个数 
in_n = size(data, 2);  % 求出data的第二维(columns)数,即特征值长度 
% 默认操作参数
default_options = [2;  % 隶属度矩阵U的指数    100;   % 最大迭代次数       1e-5; % 隶属度最小变化量,迭代终止条件   1];  % 每次迭代是否输出信息标志        

if nargin== 2,    
    options =default_options;  
else        
    %分析有options做参数时候的情况   
    % 如果输入参数个数是二那么就调用默认的option;     
    if length(options) < 4,%如果用户给的opition数少于4个那么其他用默认值;          
        tmp = default_options;       
tmp(1:length(options)) = options;         
options = tmp;      
    end     %返回options中是数的值为0(如NaN),不是数时为1    
    nan_index = find(isnan(options)==1);     %将denfault_options中对应位置的参数赋值给options中不是数的位置.     
    options(nan_index) =default_options(nan_index);    
     if options(1) <= 1, %如果模糊矩阵的指数小于等于1          
error('Theexponent should be greater than 1!');      
    end
end
%将options 中的分量分别赋值给四个变量; 
expo =options(1);           % 隶属度矩阵U的指数
max_iter = options(2);       % 最大迭代次数  
min_impro =options(3);     % 隶属度最小变化量,迭代终止条件
display = options(4);       % 每次迭代是否输出信息标志        
obj_fcn =zeros(max_iter, 1);   % 初始化输出参数obj_fcn       
U =initfcm(cluster_n, data_n);     %初始化模糊分配矩阵,使U满足列上相加为1, 

% Main loop   主要循环 
for i =1:max_iter,    
    %在第k步循环中改变聚类中心ceneter,和分配函数U的隶属度值;      
    [U, center, obj_fcn(i)] = stepfcm(data, U,cluster_n, expo);      
    if display,         
fprintf('FCM:Iteration count =%d, obj. fcn = %f\n', i, obj_fcn(i));      
    end     %终止条件判别      
    if i > 1,         
if abs(obj_fcn(i) - obj_fcn(i-1)) <min_impro,              
    break;          
end,      
    end
end      
iter_n = i; % 实际迭代次数 
obj_fcn(iter_n+1:max_iter) = [];     

%%%%%%%%%%%%%%%%%%
子函数1
function U = initfcm(cluster_n, data_n) 
% 初始化fcm的隶属度函数矩阵 
%输入: 
%   cluster_n   ---- 聚类中心个数 
%   data_n       ---- 样本点数 
% 输出: 
%           ---- 初始化的隶属度矩阵 

U =rand(cluster_n, data_n); 
col_sum = sum(U); 
U =U./col_sum(ones(cluster_n, 1), :);

%%%%%%%%%%%%%%%%%%
% 子函数2
function [U_new, center, obj_fcn] = stepfcm(data, U, cluster_n,expo) 
% 模糊C均值聚类时迭代的一步 
% 输入: 
%   data        ---- nxm矩阵,表示n个样本,每个样本具有m的维特征值 
%   U           ---- 隶属度矩阵
%   cluster_n   ----标量,表示聚合中心数目,即类别数 
%   expo         ----隶属度矩阵U的指数                        
% 输出: 
%    U_new       ----迭代计算出的新的隶属度矩阵 
%   center       ---- 迭代计算出的新的聚类中心 
obj_fcn     ---- 目标函数值 

mf = U.^expo;       % 隶属度矩阵进行指数运算结果 
center =mf*data./((ones(size(data, 2), 1)*sum(mf'))'); % 新聚类中心(5.4)式 
dist =distfcm(center, data);       % 计算距离矩阵 
obj_fcn = sum(sum((dist.^2).*mf));  % 计算目标函数值 (5.1)式 
tmp = dist.^(-2/(expo-1));     
U_new =tmp./(ones(cluster_n, 1)*sum(tmp));   % 计算新的隶属度矩阵(5.3)式

%%%%%%%%%%%%%%%%%
% 子函数3
function out = distfcm(center, data) 
% 计算样本点距离聚类中心的距离 
% 输入: 
center     ---- 聚类中心 
%   data       ---- 样本点 
% 输出: 
out         ---- 距离 
out =zeros(size(center, 1), size(data, 1)); 
for k = 1:size(center, 1), 
    %对每一个聚类中心      
    %每一次循环求得所有样本点到一个聚类中心的距离      
    out(k,:) = sqrt(sum(((data-ones(size(data,1),1)*center(k,:)).^2)',1));
end 



  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值